這些是beautifulsoup的語法,雖然不是每個都用到,但是多少還是要看一下喲!
尤其是關於尋找標籤的語法要多多注意
方法 | 語法示例 | 說明 |
---|---|---|
導入模組 | from bs4 import BeautifulSoup |
導入Beautiful Soup模組 |
創建對象 | soup = BeautifulSoup(html, 'html.parser') |
創建Beautiful Soup對象,解析HTML內容 |
找到標籤 | tag = soup.find('tag_name') |
找到第一個符合條件的標籤 |
找到所有標籤 | tags = soup.find_all('tag_name') |
找到所有符合條件的標籤,返回列表 |
獲取標籤內容 | content = tag.get_text() |
獲取標籤內的文字內容 |
尋找子元素 | child = tag.find('child_tag_name') |
尋找第一個子元素標籤 |
尋找所有子元素 | children = tag.find_all('child_tag_name') |
尋找所有子元素標籤,返回列表 |
尋找父元素 | parent = tag.parent |
獲取父元素標籤 |
尋找兄弟元素 | next_sibling = tag.next_sibling |
獲取下一個同層級元素 |
尋找前一個兄弟元素 | prev_sibling = tag.previous_sibling |
獲取上一個同層級元素 |
尋找所有後續兄弟元素 | siblings = tag.find_next_siblings() |
尋找所有後續同層級元素,返回列表 |
尋找所有前一個兄弟元素 | siblings = tag.find_previous_siblings() |
尋找所有前面同層級元素,返回列表 |
使用CSS選擇器選取標籤 | tags = soup.select('css_selector') |
使用CSS選擇器選取標籤,返回列表 |
返回第一個符合選擇器的標籤 | tag = soup.select_one('css_selector') |
返回第一個符合選擇器的標籤 |
檢查標籤是否具有特定屬性 | if tag.has_attr('attribute_name'): ... |
檢查標籤是否具有指定的屬性 |
檢查標籤是否具有多個特定屬性 | if tag.has_attrs({'attr1': 'value1', 'attr2': 'value2'}): ... |
檢查標籤是否具有多個指定的屬性 |
下一篇來終於要來實際操做啦!